理解“权”与加权平均数
一般地,若 $n$ 个数 $x_1, x_2, \cdots, x_n$ 的权分别是 $w_1, w_2, \cdots, w_n$,则:
$\frac{x_1w_1+x_2w_2+\cdots+x_nw_n}{w_1+w_2+\cdots+w_n}$
叫做这 $n$ 个数的加权平均数 (weighted average)。权 (weight),有表示数据重要程度的意思。权越大,这部分数据对最终平均数的影响力就越强(就像物理天平上更重的砝码会吸引支点靠近它)。
假设选手A在内容上得分极高,但在舞台效果上稍弱。如果采取“算术平均”,他可能和各项平庸的选手B同分;但如果我们对“内容”赋予0.5的权重,对“效果”赋予0.2的权重,选手A的加权成绩就会因其核心能力的突出而胜出。加权平均数真实地反映了选拔人才时的具体价值取向。
频数作为权:处理成群的数据
在统计大规模数据时,(如“例6 商场服装部”营业员的月销售额,或跳水队运动员的年龄调查),同样的数值会多次出现。此时,出现的次数(频数)就自然成为了该数值的权。
在求 $n$ 个数的平均数时,如果 $x_1$ 出现 $f_1$ 次,$x_2$ 出现 $f_2$ 次,$\cdots$,$x_k$ 出现 $f_k$ 次 (这里 $f_1+f_2+\cdots+f_k=n$),那么这 $n$ 个数的平均数:
$\bar{x} = \frac{x_1f_1+x_2f_2+\cdots+x_kf_k}{n}$
也叫做这 $k$ 个数的加权平均数,其中 $f_1, f_2, \cdots, f_k$ 分别叫做 $x_1, x_2, \cdots, x_k$ 的权。通过这种方式计算出的月销售目标,能过滤掉个别极端高销量的干扰,真实反映大部分营业员的普遍实力,从而制定出既有挑战性又具可行性的奖励制度。
组中值的智慧折中
当数据被粗略地分配到不同区间(数据分组)时,我们失去个体的具体数值。此时,一个小组的组中值是指这个小组的两个端点的数的平均数。例如将区间中点与该区间的频数相乘,就形成了经典的加权计算模式:
$\bar{x} = \frac{11 \times 3 + 31 \times 5 + 51 \times 20 + 71 \times 22 + 91 \times 18 + 111 \times 15}{3+5+20+22+18+15}$